#ChatGPT Atlas
OpenAI 推出瀏覽器:“讓位吧,Chrome”
台北時間10月22日凌晨,沒等來傳聞中的Gemini 3,等來了OpenAI正式發佈首款AI瀏覽器ChatGPT Atlas。簡單來說,這是一個把ChatGPT"塞進"瀏覽器的產品,你在任何網頁上都能隨時喚出ChatGPT側邊欄,讓AI幫你總結內容、編輯文字、甚至代替你完成購物和預訂任務。聽起來有點像Chrome裝了個ChatGPT外掛?確實如此,但OpenAI的野心遠不止於此。關於OpenAI開發瀏覽器的傳聞早在2024年11月就已流傳,做瀏覽器的目標很明確,爭奪網際網路資訊入口的控制權,獲取更多使用者資料。如今靴子落地,Google股價一度下跌了不少。有趣的是,OpenAI正是用一個長得最像Chrome的瀏覽器,來挑戰Chrome,用你最熟悉的方式打敗你。ChatGPT Atlas沒有選擇激進的介面革新,也沒有太多功能創新,而是保留了多標籤、網址列這些使用者習以為常的元素,只是把AI放到了瀏覽的中心位置。那麼,ChatGPT Atlas究竟有那些功能?它和市面上已有的AI瀏覽器相比,又有什麼不同?讓ChatGPT無處不在的瀏覽體驗側邊欄:ChatGPT隨時待命ChatGPT Atlas最核心的設計是將ChatGPT深度嵌入瀏覽器。在任何網頁上,使用者都可以點選Ask ChatGPT按鈕,喚出一個側邊欄。這個側邊欄自動獲取當前頁面的上下文,使用者可以直接要求ChatGPT總結程式碼差異、比較產品參數、分析文章觀點,無需再複製貼上內容。首席設計師Ryan在發佈會上演示了這一功能,強調這是“範式轉變”,瀏覽器從"僅僅展示資訊"變成"理解資訊甚至編輯資訊"的工具。但坦白說,Perplexity的Comet、The Browser Company的Dia這些AI瀏覽器早就有了。側邊欄+頁面上下文,已經是AI瀏覽器的標配。類似的是Cursor Chat功能,在網頁的任何文字框中,使用者用游標選中文字後可以直接呼叫ChatGPT進行內聯編輯。比如在Gmail寫郵件時,選中一段話,讓ChatGPT"整理我的語言"或"改成更正式的語氣",修改後的文字直接替換原文。這確實省去了在多個標籤頁之間來回切換的麻煩。瀏覽器記憶:幫你記住更多ChatGPT Atlas引入了“瀏覽器記憶”功能,這是它與傳統瀏覽器的重要區別。它不只記錄你訪問過那些網站,還會記住你在頁面上的操作行為,看了什麼內容、對比了那些產品、完成了什麼任務。這意味著你可以用自然語言搜尋歷史,比如問"找出我上周看過的所有職位招聘,並總結行業趨勢",ChatGPT會呼叫這些記憶給出個性化的分析。CEO Fidji Simo在部落格中舉了個例子,她經常瀏覽無麩質食譜,現在可以直接讓ChatGPT“根據我最近看的食譜制定本周菜單”,並通過Agent模式在Instacart上自動下單。又是菜譜?看來OpenAI對"根據食譜買菜"這個場景情有獨鍾。當然,這個功能完全可選。使用者可以在設定中查看、歸檔或刪除所有記憶,也可以在網址列控制某個網站是否允許ChatGPT讀取。清除瀏覽歷史會同步刪除相關記憶。記憶功能本來就是ChatGPT率先推出的特性,遷移到瀏覽器是自然的延伸。但問題在於,這需要使用者對OpenAI有足夠的信任,畢竟,讓AI記住你的所有瀏覽操作和行為,聽起來就像在網上“裸奔”。Agent模式:本地版Operator對於Plus、Pro和Business訂閱使用者,ChatGPT 提供了Agent模式。這是一個可以代表使用者執行任務的AI代理,它能打開標籤頁、點選按鈕、填寫表單、完成購物流程。可以簡單理解為本地版的Operator。它在Atlas的標籤頁裡行動,而不是像Operator那樣用一台雲端的獨立瀏覽器。發佈會上的演示場景包括根據食譜計算八人份配料並在Instacart下單、在Google Doc中加入評論並轉換為Linear任務。又是訂票、買菜、訂餐廳。這些演示場景從Operator發佈時就在用,已經不新鮮了。經過我們的測試,目前的網頁AI代理在簡單任務上表現尚可,但處理複雜問題時仍不夠可靠。OpenAI自己也承認,Agent可能會犯錯,甚至可能受到網頁中隱藏的惡意指令影響。OpenAI強調Agent是"協作式"的,使用者可以隨時監控進度或接管控制權。在我們的測試中ChatGPT Atlas未能完成電商比價任務安全方面,Agent僅在使用者的標籤頁內運行,不能在電腦上執行程式碼或訪問檔案系統。在金融網站等敏感場景,它會暫停並等待使用者確認。使用者也可以選擇"登出模式",限制Agent訪問已登錄的帳戶資料。它和其他AI瀏覽器最大不同,就是它是OpenAI發佈的AI瀏覽器賽道已經相當擁擠。Perplexity的Comet主打AI側邊欄和多步驟任務自動化,還有能主動給出洞見的背景助手,同樣免費開放,Microsoft Edge的Copilot模式整合了聊天和搜尋功能,支援多標籤對比和語音控制,與微軟生態深度繫結;The Browser Company的Dia則更注重介面美學和工作流最佳化,強調與標籤對話的能力,可以作為寫作夥伴和個人助理。所以單從目前功能層面,ChatGPT Atlas並沒有從樣貌上徹底重新設計瀏覽器。側邊欄、頁面總結、自動化任務,這些都是很多AI瀏覽器的標準配置。它也沒有推翻瀏覽器的形態本身,只是把AI放到了瀏覽的中心位置,讓使用者在熟悉的介面中獲得智能化的體驗。此外,首發就面向所有使用者開放(Agent模式除外),也體現了OpenAI快速佔領市場的決心。在體驗上,接下來它還需要證明自己不只是Chrome加了個ChatGPT外掛。畢竟Edge早就引入了Copilot,而Chrome也可以輕易加入Gemini側邊欄,Gemini游標、Agent模式,還有著龐大的使用者基數和生態優勢。但在此之外,OpenAI的Atlas絕對不只是“又一個瀏覽器”這麼簡單。在OpenAI的思路里,你也能看到,他們強調的Atlas的亮點之一,就在於與ChatGPT帳戶的深度整合,瀏覽器可以呼叫使用者在ChatGPT中的歷史對話和偏好設定,實現跨裝置、跨平台的一致體驗,跨會話、跨網站的記憶系統也不只是單次對話的上下文,對於重度ChatGPT使用者來說,有了它至少可以少開一個應用,也不用跨窗口複製貼上了。OpenAI CEO Fidji Simo在部落格中闡述了發佈ChatGPT Atlas的意圖,“我們希望ChatGPT從一個孤立的、被動的文字聊天介面,演變為一個直覺化的超級助手,連接你需要的所有服務。”她提出了ChatGPT將成為你生活的作業系統。而瀏覽器是這一戰略的關鍵節點,因為它是大多數人獲取資訊、完成任務的入口。也就是說,OpenAI的Atlas最大的“不同”,就是它是由OpenAI發佈的。ChatGPT Atlas帶來的是ChatGPT整個生態的能力與使用者關係。這使得它是第一個可以不只在Chrome設定的規則內進行功能修補,而試圖從根本上改變人們對瀏覽器的使用邏輯的產品——它要在已經被ChatGPT塑造了使用習慣的數億使用者的基礎上,把瀏覽體驗的核心從Google的搜尋引擎,轉移到OpenAI的AI模型上。這本質上還是OpenAI要把ChatGPT打造成未來全知全能的作業系統的路線裡,必要的一步。用一個最像Chrome的樣子,對使用者來說熟悉的介面幾乎沒有學習成本;而對競爭對手,尤其是Google而言,這算是一個真正的警告了。接下來可以預期的是,它會迫使Google、微軟等巨頭更快速地將AI深度整合進自己的瀏覽器產品。所有人都會捲入OpenAI的AI時代作業系統之爭中去。 (矽星人Pro)
突發!OpenAI深夜推出瀏覽器ChatGPT Atlas:一文深度詳細解析「率先支援mac OS」
Sam Altman 太“壞了”,昨天DeepMind產品負責人logan 宣佈今天要發新新東西,結果又被sam截胡,OpenAI終於丟出了瀏覽器產品:ChatGPT Atlas。Sam 新口號(新大餅):重塑瀏覽器就在剛剛,OpenAI 正式推出名為 ChatGPT Atlas 的全新人工智慧驅動的瀏覽器,旨在通過將對話式 AI 深度整合到使用者的日常網頁瀏覽體驗中,從而徹底改變人們與網際網路互動的方式。其核心理念是,AI 提供了一個十年一遇的契機,可以重新思考瀏覽器的本質和功用。Atlas 並非簡單地在傳統瀏覽器上附加一個聊天按鈕,而是將 ChatGPT 作為其“跳動的心臟”,使其成為一個能理解、協助甚至代為執行任務的智能伴侶介面長這樣,感覺平平無奇:ChatGPT Atlas引入了三個核心功能:讓聊天無處不在的“隨行聊天 (Chat Anywhere)”、能夠跨網站學習使用者偏好的“瀏覽器記憶 (Browser Memory)”以及可以自主操作網頁完成複雜任務的“代理模式 (Agent Mode)”。通過這些創新,ChatGPT Atlas 致力於將瀏覽體驗從被動的資訊展示,轉變為一種主動、高效且高度個性化的協同工作流程ChatGPT Atlas 今天面向全球的 macOS 使用者正式上線。所有使用者均可下載和使用基礎版的瀏覽器,更高級的“代理模式 (Agent Mode)”功能,在初期將僅對 Plus 和 Pro 付費使用者開放,Windows、iOS 和 Android 平台的版本正在開發中以下是詳細解讀,先不要看會不會顛覆現有的額瀏覽器,大家可以感受一下OpenAI的思路,感興趣的接著往下看:Atlas 的三大支柱:核心功能解析Atlas產品負責人 Adam Fry 詳細介紹了構成 ChatGPT Atlas 體驗的三大核心功能支柱。Atlas 在提供創新功能的同時,也保留了所有使用者熟悉的傳統瀏覽器元素,如標籤頁、書籤、密碼自動填充等,確保了無縫的過渡體驗。以下是三個功能解析1.Chat comes with you anywhere (隨行聊天)這個功能旨在解決使用者在傳統工作流中反覆在不同標籤頁之間複製和貼上內容的痛點。在 Atlas 中,無論你正在撰寫電子郵件、編輯文件還是瀏覽任何網頁,ChatGPT 都可以被即時呼叫。它會以側邊欄或行內工具的形式出現,並且能夠理解你當前頁面的上下文這意味著當你需要幫助時,AI 助手就在你手邊,並且因為它瞭解你正在做什麼,所以能夠提供更具相關性和幫助性的建議。這徹底改變了以往需要打開一個專門的 ChatGPT 標籤頁,再將內容貼上過去進行處理的繁瑣流程2.Browser Memory (瀏覽器記憶)該功能將 ChatGPT 廣受歡迎的“記憶 (memory)”特性從單一的聊天會話擴展到了整個網路瀏覽體驗中。Adam 解釋說,使用者之所以喜愛 ChatGPT 的記憶功能,是因為隨著使用時間的增長,它會變得越來越個性化,更能理解使用者的需求。在 Atlas 中,這種個性化的學習能力將貫穿你訪問的每一個網站。瀏覽器會安全地、選擇性地記住你的偏好、歷史記錄和行為模式,從而提供更加貼心和高效的幫助。這使得整個瀏覽器體驗隨著你的使用而不斷進化,變得越來越懂你,最終成為一個真正為你量身定製的工具3.Agent (代理模式)這是 Atlas 最具突破性的功能。在代理模式下,ChatGPT 不再僅僅是一個提供資訊和建議的助手,而是能夠主動為你“採取行動 (take actions)”的執行者。當你授權它時,螢幕上會出現一個代表代理的小游標,它會像人類使用者一樣開始在網頁上點選、輸入和導航。舉例來說,代理可以幫助你預訂餐廳或機票,甚至直接在你正在處理的文件中進行編輯。這一功能將瀏覽器從一個資訊消費工具,轉變為一個可以為你分擔實際工作的強大生產力平台Atlas 體驗統一的主螢幕Atlas 的主螢幕,這是使用者每次打開應用或新建標籤頁時都會看到的介面。螢幕中央是一個醒目的編輯器 ,使用者可以直接在這裡像平常一樣向 ChatGPT 提問。同時,使用者也可以方便地訪問所有的工具、模型選擇以及包含聊天歷史的側邊欄然而,由於它是一個瀏覽器,這個介面能做的事情遠不止聊天。具有多種互動方式:智能導航:輸入“hacker news”,瀏覽器會直接識別意圖並跳轉到相應的 URL自然語言書籤:用自然語言說出“open my commits for this galaxy diff”,瀏覽器便能理解並打開你之前收藏的一個特定的 GitHub 提交頁面基於記憶的搜尋:當不確定一份文件的具體位置時,輸入了“搜尋關於Atlas core design 文件”。瀏覽器開始搜尋瀏覽記憶,並會成功找到了儲存在 Google Docs 中的目標檔案,點選即可打開主螢幕編輯器的下方是“建議 ”區域。這是 Atlas 個性化功能的初步體現。這些建議會根據 Atlas 對你近期活動的理解,為你生成可能感興趣的內容,從簡單的新聞故事到更高級的代理任務委託。你使用 Atlas 的次數越多,這些建議就會變得越精準隨行聊天:伴侶側邊欄的實際應用比如切換到了一個 GitHub 頁面,上面是有一些正在處理的一些程式碼。在任何網頁的右上角,使用者都會看到一個“ask chatgpt”按鈕。點選後,螢幕右側會滑出一個“側邊欄 ”在這個側邊欄中,你可以執行所有與 ChatGPT 相關的常規操作,但關鍵區別在於,它現在能夠看到並理解當前網頁的具體內容。這是一個重大的解鎖,它將瀏覽器從一個僅僅為你展示資訊的工具,轉變為一個能夠理解資訊,甚至在某些情況下為你編輯資訊的智能夥伴演示兩個場景:1.讓ChatGPT 總結當前程式碼差異 (diff) 的內容,AI 迅速給出了準確的摘要2.提出了一個更複雜的問題:“將這個提交挑選到今天要發佈的 RC 版本中安全嗎?”。AI 會給出一個比如“風險很低”的評估全新的搜尋範式Atlas 對搜尋功能的重大升級。在瀏覽器中搜尋一部想看的電影時,搜尋結果頁面頂部出現了一系列標籤,如圖片、視訊和新聞 ,讓使用者可以像在傳統搜尋引擎中一樣快速切換內容類型,同時又不失核心的聊天體驗最有趣的創新在於點選搜尋結果後的互動。比如當點選一條影評連結時,頁面並非全螢幕跳轉,而是默認將聊天側邊欄滑入,並將網頁連結以分屏檢視的形式打開。這種設計是讓你在瀏覽搜尋結果時,身邊始終有一個 AI 伴侶。這創造了一種“多輪體驗 ”,你可以就當前瀏覽的頁面內容持續與 AI 進行對話和提問,而不是被簡單地傳送到一個網頁後就中斷了與搜尋引擎的互動在看著四星好評的影評時,可以直接在側邊欄問 ChatGPT:你能用五個或更少的詞總結這篇評論嗎?,可以立即得到更精煉回答游標聊天:行內 AI 輔助一個非常普遍的工作流程是我們在郵件或文件中寫好初稿,複製到 ChatGPT 進行潤色,再把修改後的結果貼上回來。Atlas 的目標是扁平化這個流程你可以在郵件草稿中,他選中了一段寫得較為隨意的文字,文字旁邊立即出現了一個小的ChatGPT 小部件。點選後,輸入指令:潤色我的語言。AI 隨即在原地提供了一個更優雅、更專業的版本。當他點選“更新 ”按鈕時,原始選中的文字就被 AI 生成的新文字無縫替換了。這種功能允許使用者執行“範圍非常明確的編輯”,極其有用釋放Agent的潛力:專屬網路助理不得不服,別管實際工作表現如何,OpenAI的互動設計還是很酷炫的,這在Agent 模式裡也體現的淋漓盡致Atlas 的高級功能——代理模式 (Agent Mode)。Atlas 如何被賦予能力,代表使用者在網路上自主執行任務呢?專業任務自動化第一個場景設定在工作中。比如工作團隊正在用一個 Google Doc 非正式地規劃一個鬼屋項目。現在面臨兩個挑戰:1.文件中有些成員沒有填寫他們本周的任務(標記為“to-do”)。他需要禮貌地在文件中留言提醒他們2.團隊使用一個名為 Linear 的正式項目管理工具,他需要將 Google Doc 中所有已填寫的任務,遷移並建立為 Linear 中的“issues”(任務)如果自己項目管理經驗不足,也不太熟悉 Linear 的操作。因此,可以將這項繁瑣的任務完全委託給 Atlas 的代理模式。點選了介面上的“Agent Mode”按鈕,並下達了指令。這個模式告訴 ChatGPT,希望它能在 Atlas 內部“代表我採取行動 “啟動後,螢幕上出現了一個獨立的代理游標,開始自主地在 Google Doc 頁面上移動和點選,就像一個真人在操作一樣。OpenAI強調,這個代理是在使用者的本地瀏覽器中運行,可以訪問使用者所有的本地認證資訊(如登錄狀態)和歷史記錄,感覺就像是“使用者自身的自然延伸 ”。使用者可以即時觀看代理的操作過程,也可以切換到其他標籤頁做自己的事,讓代理在背景執行經過一段時間:結果顯示,代理不僅成功地在 Linear 中建立了所有任務並正確地標記了負責人,還在 Google Doc 中為那些未完成任務的同事留下了禮貌的提醒評論。這個功能極大地節省你的時間和精力,實現了從“vibe coding”(憑感覺程式設計)到“vibe lifing”(憑感覺生活)的跨越,讓使用者可以將生活和工作中各種繁瑣的任務委託給 Atlas 代理個人生活輔助一個常見的煩惱:需要根據用餐人數(8人)重新計算食材用量,並列出購物清單。可以首先使用普通的聊天功能詢問 Atlas:為八個人做這道菜我需要買什麼食材?。ChatGPT 迅速閱讀了網頁,完成了計算,並生成了一份清晰的購物清單接下來,將任務升級。在確認自己只需要購買肉和蔬菜後,對 ChatGPT 說:你能幫我訂購這些肉和蔬菜嗎?。此時,ChatGPT 識別出這是一個需要實際操作的任務,並主動請求授權以代理模式接管瀏覽器。點選“繼續 (continue)”後,代理便開始了行動代理會展現出個性化能力:它知道你習慣電商購物,於是直接導航到了該網站。在搜尋框中輸入商品名稱,並將正確的商品逐一加入到購物車中。最終,代理並沒有直接下單付款,而是將裝滿商品的購物車準備好,交由你最後稽核和確認。這體現了其作為“助手”而非完全自主決策者的設計理念,確保使用者始終擁有最終控制權安全在展示代理模式強大能力的同時,OpenAI團隊也花了大量篇幅強調其圍繞安全和使用者控制所做的設計。與 ChatGPT 共享整個瀏覽器的存取權也帶來了一系列全新的風險。因此,將安全性根植於從模型到產品體驗的每一個環節至關重要。內建的安全保障與操作邊界首先,代理模式有一些硬性限制以保障基礎安全。它只能在使用者打開的瀏覽器標籤頁內操作,無法執行使用者電腦上的本地程式碼,也無法訪問瀏覽器之外的任何檔案。它的活動範圍被嚴格限制在使用者的網路瀏覽會話中精細的使用者控制:登錄與登出狀態Atlas 賦予了使用者精細的控制權。在一個新標籤頁中,使用者可以隨時決定 ChatGPT 代理是以“登錄 (logged in)”狀態還是“登出 (logged out)”狀態運行登錄狀態:代理可以使用使用者在該網站的登錄憑證和個人資料,適合需要訪問個性化資訊(如 Instacart 購物歷史)的任務。登出狀態:代理在沒有個人資料存取權的情況下執行任務,適用於那些不需要登錄的通用操作團隊建議使用者在執行每項任務前仔細考慮,代理是否真的需要訪問你的登錄資訊,從而以最小權限原則來保障資料安全可選且透明的記憶功能“瀏覽器記憶 (browser memories)”功能也是完全可選的。使用者在首次設定瀏覽器時就可以選擇是否開啟。即使開啟後,使用者也可以隨時在設定中查看、管理甚至刪除這些記憶。這確保了使用者對自己的資料擁有完全的知情權和控制權用於保護隱私的隱身模式對於任何使用者不希望被瀏覽器或 ChatGPT 記憶的瀏覽活動和查詢,Atlas 同樣提供了標準的“隱身窗口”。團隊以一個幽默的例子說明了其用途,比如當你想問一個私密問題時,就可以使用隱身模式來保護隱私Sam Altman大餅計畫Sam Altman 認為人工智慧的崛起代表著一個十年一遇的罕見機會 ,促使我們去重新思考瀏覽器的定義、使用方式,以及如何更高效、更愉快地利用網路。他指出,自從標籤頁 (tabs) 出現以來,瀏覽器領域在很長一段時間內都未曾見過重大的創新。這讓 OpenAI 的團隊感到興奮,因為他們看到了一個真正重塑這一核心工具的巨大潛力Altman 提出了一個核心的時代類比:在過去的網際網路時代,瀏覽器的網址列 (URL bar) 和搜尋框 (search box) 是人們與網路互動的主要入口,是一種完美的模式。而現在,隨著人們開始以新的方式使用網際網路,他們相信“聊天體驗 ”將成為未來與網路互動的全新、更佳的模式。基於這一理念,團隊開始著手設計一款以對話式體驗為中心的瀏覽器Atlas 的工程負責人 Ben Goodger 進一步闡述了這一設計哲學。他強調,Atlas 的誕生源於一個簡單而深刻的問題:如果你能和你的瀏覽器聊天會怎樣?。從這個想法出發,團隊重新構想了整個瀏覽體驗,目標是用簡潔的對話取代多年來積累的混亂和複雜 。一個關鍵的設計原則是,要避免讓 Atlas 感覺像是“一個僅僅被釘上聊天按鈕的舊瀏覽器”。相反,他們將 ChatGPT 置於產品的核心,使其成為 Atlas “跳動的心臟 (the beating heart of Atlas)”。這意味著 ChatGPT 將始終陪伴在使用者身邊,隨時準備在你瀏覽網頁時提供幫助Sam Altman 認為當前展示的功能僅僅是這個項目的早期階段。未來真正令人興奮的可能性在於,當使用者的“自訂指令”能夠跟隨他們到網路的每一個角落時,會發生什麼。他描繪了一個未來場景:一個越來越瞭解你的代理,能夠主動為你整合資訊,發現你可能在網際網路上感興趣的內容,並將它們彙集在一起。這將遠遠超出當前演示的範圍,實現更高層次的智能協同 (AI寒武紀)
OpenAI:游標即對話,Atlas 讓網頁內容可直接改
2025年10月21日,OpenAI 推出 ChatGPT Atlas, 一個將 ChatGPT 作為核心建構的瀏覽器。發佈會上,CEO Sam Altman 說:“我們不是把 ChatGPT 加進瀏覽器,而是把瀏覽器變成 ChatGPT。”過去,你需要複製網頁內容,貼上到 ChatGPT,反覆詢問修改建議。 現在,ChatGPT 直接出現在你瀏覽的頁面上。它能讀取頁面內容,理解上下文,執行操作。網頁不再只是資訊的展示介面,而是任務的執行空間。瀏覽器的定位發生了根本改變:從資訊瀏覽工具,變成了任務執行平台; 從被動的展示層,變成了主動的操作層。很多人的第一反應是:這不就是個帶智能體的瀏覽器嗎?Altman 給出的答案是:這是十年一遇的機會,重新定義人如何使用網路。而這,不只是 OpenAI 的判斷。整個瀏覽器行業都在押注同一個方向:一場關於瀏覽器入口和執行權的爭奪,已經開始。第一節|Atlas 發佈:瀏覽器做事了“你會看到游標開始點選,這是 AI 在替你做事。”OpenAI 發佈會上,這句話配合的演示畫面震撼了全場。ChatGPT Atlas 看起來像普通瀏覽器:有標籤頁、書籤、輸入框。 但它做的事情完全不同:不是讓你尋找答案,而是直接幫你完成任務。Atlas 有三項核心能力:一、隨處對話:你不需要來回覆制貼上了過去,瀏覽網頁時想問 ChatGPT,需要切換標籤頁,複製內容,再組織語言提問。現在,在 Atlas 中,你只需點選一個按鈕,ChatGPT 就能在當前網頁打開聊天窗口,它知道你正在看什麼,直接基於上下文對話。現場演示中,他們打開 GitHub 頁面,輸入:總結一下這個 diff。ChatGPT 立即理解了變更記錄的上下文,輸出內容摘要。緊接著再問:這個改動能安全地併入我們要發佈的版本嗎?AI 給出了風險分析與建議。整個過程,不需要來回切頁面,也不用重新解釋上下文。ChatGPT 就像坐在你旁邊的助手,隨時能看你的螢幕並給出建議。二、瀏覽器記憶:ChatGPT 開始記得你做過什麼ChatGPT 的記憶功能,在 Atlas 中第一次和網頁瀏覽歷史打通了。你可以對它說:找一下上周我看過的關於 Atlas 核心設計的文件。ChatGPT 會自動呼叫你的瀏覽歷史,在你不記得文件標題的情況下,找出你點開過的內容並幫你打開。使用者現場反饋說:我不再擔心找不到之前看過的內容,因為我知道它記得。這不是歷史記錄的改版,而是讓記憶成為任務鏈的一部分。你訪問過什麼、看過什麼、搜尋過什麼,都會在需要時被呼叫,幫你完成任務。三、智能體模式:游標變成了你的 AgentAgent Mode(智能體模式),你可以讓 ChatGPT 在瀏覽器中自己動手:點選頁面按鈕、填寫表單、搜尋內容、加入購物車、甚至編輯 Google Docs。你只需交代一個目標,它會幫你完成整個流程。現場演示中,開發者發出請求:幫我根據 Google 文件裡的內容,為每個人生成 Linear 任務,並通知沒填寫內容的同事。幾秒後,游標自動開始操作:打開連結、填寫任務、傳送提醒。產品負責人說:智能體知道我是那個項目的負責人,知道我平時用 Linear 管理任務,也知道我希望提醒團隊但又不想太生硬。它用了禮貌的語氣留言,這讓我覺得很貼心。Atlas 最大的不同在於:ChatGPT 不是外掛,而是瀏覽器本身的一部分。用開發團隊的話說:我們沒有在老瀏覽器上加一個 AI 按鈕,而是從頭開始,用 ChatGPT 建構整個瀏覽體驗。網頁從靜態資訊頁,變成了可以請 AI 處理的工作空間。第二節|三個場景看 Atlas 如何工作發佈會用了三個實際場景,展示 Atlas 的核心互動方式。✅ Gmail 場景|改郵件就像修改文件設計師 Ryan 打開了一封寫到一半的 Gmail 草稿。他正在給同事寫感謝信,但覺得寫得不夠好。他直接選中文字,點選瀏覽器右上角的 ChatGPT 按鈕,輸入:整理我的語言。ChatGPT 沒有跳出對話方塊,而是直接在郵件正文上修改。幾秒鐘後,句子變得更簡潔、更自然。點選“替換”,原內容被新措辭覆蓋。整個過程不超過5秒。✅ GitHub 場景|程式碼審查有了第二雙眼睛開發者打開了一個提交(commit),內容是更新某個星系生成器的視覺效果。他點選“詢問 ChatGPT”,輸入: 這個改動會影響頁面載入速度嗎?ChatGPT 回覆: 不會。改動主要在WebGL渲染層,隻影響動畫效果,不涉及資源載入或DOM操作。開發者追問: 那能安全合併到今天的發佈版本嗎?ChatGPT 回答: 可以。改動僅限視覺效果,不影響主邏輯,風險可控。但建議在合併前做一次回歸測試。這不是程式設計問答網站那種通用答案,而是結合程式碼上下文做出的操作建議。它理解的不只是文字,而是你在看什麼、準備做什麼、擔心什麼。✅ Instacart 場景|從列清單到下單,AI 全程操作產品經理 Justin 打開一個菜譜網頁,要為 8 個人準備這道菜。他對 ChatGPT 說:幫我列出需要採購的食材。幾秒鐘後,AI 列出了按超市貨架分類的清單。Justin 繼續:只幫我訂購肉類和蔬菜。ChatGPT 自動進入智能體模式,打開 Instacart,搜尋商品,加入購物車。全程 Justin 沒有動手,只是在旁邊看著 AI 操作。幾分鐘內,整份訂單就準備完畢。Justin 說:我自己下單都沒這麼快。修改郵件、分析程式碼、執行購物,三個場景背後是同一套能力:讀懂頁面、理解意圖、完成動作。ChatGPT 從對話方塊走進了網頁本身。第三節|從工具到夥伴:瀏覽器裡的副駕“我不再操作它,而是批准它操作我的瀏覽器。”這是 Atlas 工程師 Justin 在發佈會現場說的原話。這句話標誌著一個根本轉變:AI 不再是被動的工具,而是主動的協作者。在傳統瀏覽器裡,完成一件事需要你拆解每個步驟。打開標籤頁、找連結、複製內容、跳進 ChatGPT 提問、拿到回覆再跳回來。每個動作都需要你自己完成。Atlas 改變了這個流程。你只需說“我希望完成什麼”,AI 會理解任務、打開頁面、執行操作、把結果交給你確認。因為它始終線上,它記得你的習慣、理解你的上下文、預判你的需求。你不再需要重新告訴它每一個細節,它是你的大腦的延伸。但這不是把控制權交出去。Atlas 的設計理念是“副駕,不是自動駕駛”。它幫你處理瑣碎的重複工作,決策權始終在你手裡。設計負責人 Ryan 說:它像個隊友,始終和你在同一頁面。你打開頁面,它也在看。你正在寫,它也在想。你開始發愁下一步,它已經準備動手。產品經理 Justin 總結:過去是我操作網頁,現在是我們一起把事做完。瀏覽器是你所有上下文、工具和目標的匯聚地。Atlas 讓 AI 融入其中,成為你的工作夥伴。第四節|入口之爭:誰掌握執行權,誰就贏得未來當瀏覽器從工具變成夥伴,一個更大的問題浮出水面:誰的 AI 能真正為使用者做事,誰就掌握了網際網路的新入口。✅ Atlas 不是唯一玩家Atlas 不是唯一在做 AI 瀏覽器的公司。Perplexity 的 Comet 在 7 月首次發佈,10 月 2 日免費開放,強調對話式搜尋和側邊欄助手。Google 在 9 月 18 日向所有美國使用者推出 Gemini in Chrome,可以總結網頁、跨標籤頁工作,並宣佈未來幾個月推出智能體功能。Microsoft Edge 在 7 月推出 Copilot Mode,把 Copilot 從側邊欄工具升級為瀏覽器的核心體驗。國內市場上,360、夸克、秘塔等瀏覽器也都在 2025 年升級了 AI 功能。但 Atlas 的不同在於:它不是在現有瀏覽器上加 AI,而是用 ChatGPT 重新建構整個瀏覽體驗。在 Comet 裡,你仍然需要明確地提問,讓它去搜尋和總結。在 Chrome 裡,你還是要點連結、比選項、做決策。而在 Atlas 裡,你只要說:幫我做完。它會自動打開頁面、執行操作,直到任務完成。✅ 從資訊入口到執行入口過去,瀏覽器之爭是關於“使用者去那裡”。但當 AI 能真正執行任務,使用者不再需要去那裡,而是直接說“幫我做什麼”。正如 OpenAI 所說:Atlas 是專為 ChatGPT 設計的瀏覽器,讓 AI 能真正為你做事誰先讓使用者把任務交給你,誰就贏得了未來。Altman 在發佈會最後說:ChatGPT 可以理解你的意圖,掌握上下文,並幫你完成目標。這才是我們想做的瀏覽器。今天你打開 Atlas,可能只是為了寫封郵件、點份外賣。但當你習慣了這種協作方式,幾個月後:你不會再打開十個標籤頁比較航班,而是直接說“幫我訂去東京最便宜的機票”;不會再逐條瀏覽招聘網站,而是說“找出適合我的職位並準備申請材料”。從主動搜尋到直接委託,從人在操作到 AI 執行這是人類使用網際網路方式的根本改變。而這種改變能否真正發生,關鍵在於信任。Chrome 有 30 億使用者,但使用者忠誠度只維持到“有更好的東西出現”那一刻。OpenAI 的優勢在於,ChatGPT 已經擁有 8 億周活躍使用者。這些使用者已經習慣了與 AI 對話,已經建立了信任。Atlas 的挑戰是將這種信任延伸到瀏覽器:讓使用者相信 AI 可以成為工作夥伴,而不只是回答問題的工具。當這種信任建立,入口就會轉移。這場爭奪已經開始。結語|游標會動,對話即行動AI 瀏覽器正在改變一個我們習以為常的邏輯。過去,你打開瀏覽器是為了找資訊。現在,無論是 Atlas、Comet 還是其他 AI 瀏覽器,它們都在嘗試幫你直接完成任務。游標會動,頁面能聽懂,AI 會執行。瀏覽器從展示窗口,變成了協作夥伴。這不只是某個產品的創新,而是整個行業正在發生的互動方式轉變。當 AI 真正融入瀏覽器,人類使用網際網路的方式正在被改寫。 (AI 深度研究員)
一度下跌超4%!OpenAI推出AI瀏覽器ChatGPT Atlas,Google嚇壞了?
OpenAI周二推出該公司首款由人工智慧驅動的網頁瀏覽器ChatGPT Atlas,旨在為使用者提供更個性化的上網體驗,同時還能執行代理任務,例如預訂航班或編輯文件。媒體稱,這標誌著這家ChatGPT的開發商在新戰線上與Alphabet旗下的Google展開競爭,Google母公司Alphabet股價周二一度下跌4.8%。OpenAI表示,Atlas現已在macOS系統上全球發佈,未來將“很快”擴展至Windows、iOS和Android平台。OpenAI周二推出該公司首款由人工智慧驅動的網頁瀏覽器,媒體稱,標誌著這家ChatGPT的開發商在新戰線上與Alphabet旗下的Google展開競爭,因為越來越多的網民開始依賴人工智慧來獲取資訊。OpenAI將這款瀏覽器將命名為ChatGPT Atlas,旨在為使用者提供更個性化的上網體驗,同時還能代表使用者執行任務,例如預訂航班或編輯文件。公司表示,這款瀏覽器是圍繞ChatGPT建構的,每當使用者訪問網頁時,頁面上都會出現“Ask ChatGPT”的選項,點選後即可在側邊欄與ChatGPT互動。比如,使用者打開一篇電影評論,可以讓ChatGPT幫忙總結內容;或者找到一個菜譜,再讓ChatGPT幫忙在網上訂購所需食材。OpenAI首席執行官Sam Altman在周二的直播活動中表示,“這是一個以ChatGPT為核心、由人工智慧驅動的瀏覽器。”“我們認為,人工智慧為重新思考瀏覽器的意義提供了一個十年一遇的機會。”“這是一款全方位優秀的瀏覽器——流暢、快速,而且用起來非常舒服。”OpenAI表示,Atlas現已在macOS上全球發佈,隨後將陸續推出Windows、iOS和Android版本。目前,只有付費使用者(ChatGPT Plus與Pro訂閱者)才能使用更高級的AI代理功能。OpenAI表示,目前已有超過8億使用者在使用ChatGPT,但其中許多人使用的是免費版本。OpenAI目前仍在虧損營運,正尋求實現盈利的新方式。媒體稱,借助自家瀏覽器切入網路搜尋入口,可能幫助OpenAI這家全球估值最高的初創公司吸引更多網路流量,並借此獲得數字廣告帶來的收入。媒體表示,OpenAI由此加入了一批正在借助AI重新構想瀏覽器產品的公司隊伍。這類產品最早可追溯至1990年代。AI初創公司Perplexity AI近期剛剛推出了Comet瀏覽器,其設計理念是充當數字助手,能夠為使用者自動完成任務。Opera和The Browser Company也都在為自家瀏覽器加入更多AI功能。ChatGPT進入側邊欄,內建AI代理OpenAI負責Atlas項目的工程主管Ben Goodger在周二的直播中表示,ChatGPT是該公司首款瀏覽器的核心。使用者在ChatGPT Atlas中可以與搜尋結果進行對話,就像在Perplexity或Google的AI模式中一樣。其他AI瀏覽器的“殺手級功能”是內建的側邊聊天面板(side panel)——聊天機器人會自動獲取使用者螢幕上的上下文資訊。聽起來似乎微不足道,但很多使用者每天都在不斷複製貼上文字、拖曳檔案或連結到ChatGPT中,以便提供背景資訊。而這個側邊功能則消除了這些繁瑣步驟,讓使用體驗更加順暢。OpenAI產品負責人Adam Fry在直播中表示,ChatGPT Atlas同樣配備了這種“sidecar”功能。此外,Atlas還具備“瀏覽歷史”功能,也就是說ChatGPT可以記錄使用者訪問的網站及其操作內容,並據此提供更個性化的回答。在Atlas中,每當你點選搜尋結果的連結時,默認會顯示分屏介面:左側是網頁,右側是ChatGPT對話記錄。這樣設計的目的是讓AI“助手”始終伴隨在旁。使用者也可以關閉分屏模式。員工在直播中還展示了瀏覽器的網頁摘要功能,以及如何在郵件中選中一句話並點選按鈕讓ChatGPT即時潤色的功能——這一特性被稱為“游標聊天(cursor chat)”。AI瀏覽器的另一個常見特點是內建AI代理(agent),旨在幫助使用者自動完成網頁上的任務。根據媒體的測試,早期版本的網頁AI代理仍有待改進。雖然Perplexity的Comet和OpenAI的ChatGPT代理在執行簡單任務時表現良好,但在處理使用者真正想交給AI的複雜事務時仍顯力不從心。正如外界預期,OpenAI的瀏覽器也配備了網頁代理功能。使用者可通過“agent模式”讓ChatGPT在瀏覽器中代為完成一些小任務。公司表示,該功能在發佈初期僅對ChatGPT Plus、Pro和Business等級的使用者開放。Fry表示,“在Atlas中,ChatGPT現在可以替你執行操作……它能幫你預訂餐廳或航班,甚至直接編輯你正在處理的文件。”在OpenAI的DevDay大會上,ChatGPT主管Nick Turley在接受媒體採訪時表示,他受到瀏覽器重新定義作業系統形態的啟發。Turley指出,瀏覽器徹底改變了人們線上工作的方式,而他認為ChatGPT也是一種類似的革命性現象。正面挑戰Chrome,Google股價應聲下跌至於OpenAI的瀏覽器能否撼動目前擁有全球超過30億使用者的Google Chrome,還不得而知。受這一消息影響,Google股價一度下跌達4.8%,跌幅隨後有所縮小。Chrome目前在全球擁有約30億使用者,媒體稱,Chrome的巨大成功為OpenAI進入瀏覽器市場提供了潛在的範本。Google在2008年發佈Chrome時,微軟的Internet Explorer(IE)瀏覽器仍佔據主導地位,當時幾乎沒人相信有新瀏覽器能構成實質性威脅。但Chrome很快憑藉比IE更快的網頁載入速度,以及其他優勢,贏得了大量使用者,從而顛覆了整個市場。微軟最終放棄了IE,轉而推出新的Edge瀏覽器,其運行方式與Chrome類似。今年9月,Google已將其Gemini AI模型整合至Chrome瀏覽器中。使用者可通過該AI完成多項任務,包括解釋所訪問網頁的內容、跨多個標籤頁提煉資訊,甚至還可恢復此前關閉的網站,並計畫在未來幾個月內讓Gemini能夠代替使用者處理“繁瑣任務”,例如網上購物、預約或訂餐等。不過,Google尚未公佈確切的上線時間。Google的這一舉動發生在美國一名法官駁回政府強制其出售Chrome的提議兩周之後。在那場法庭聽證會上,來自Perplexity和OpenAI的高管曾表示,如果Google被迫剝離Chrome,他們有意出手收購。 (invest wallstreet)
ChatGPT Atlas:一場關於“點選權”的文明戰爭?
當搜尋被淘汰,AI 開始直接理解世界10 月 21 日,OpenAI 發佈 ChatGPT Atlas——一款被稱作“AI 瀏覽器”的新產品。它的出現,看似功能升級,實則改寫了網際網路三十年來最核心的權力:入口主權。當 AI 開始理解、記憶並代理人類的行為,瀏覽器不再屬於使用者,而屬於演算法。OpenAI 用 Atlas 打開了新入口10 月 21 日,舊金山。OpenAI 發佈了全新產品 —— ChatGPT Atlas。官方介紹裡,它被稱為“一款以 ChatGPT 為核心的 AI 瀏覽器”。但與傳統瀏覽器不同,Atlas 在結構層徹底重寫了“瀏覽”的邏輯。右側的 ChatGPT 面板不再只是對話方塊,它能直接解析網頁、提取資訊、生成摘要、跨站點比對,甚至在授權下執行任務:自動填表、整理文件、完成購買。它還擁有“記憶系統”:能記錄使用者的興趣、節奏與偏好,讓 AI 在下一次打開網頁時提前理解你的需求。OpenAI 在發佈會上說得輕描淡寫:“Atlas 讓 AI 不再是工具,而是一個能理解並執行網路任務的存在。”一句話,AI 第一次從“回答問題”邁進了“執行世界”。瀏覽器:網際網路最古老的權力中心瀏覽器看似普通,卻是網際網路秩序的起點。從 Netscape 到 IE,再到 Chrome,它決定了人類如何進入網路、誰擁有流量、誰控制資訊。Google 正是依靠 Chrome + Search 建立起注意力帝國。使用者的每次點選,都會回饋資料,廣告系統在背後精準分發。這是網際網路的原始閉環。但 Atlas 從根上撕開了這條鏈。它不再等待人類輸入,而是主動為 AI 服務。當瀏覽器的目標從“展示網頁”變成“理解網頁”,權力的天平就已經傾斜。從 ‘搜尋’ 到 ‘執行’ :瀏覽器邏輯的崩塌Chrome 的核心邏輯是“等待人類點選”,Atlas 的邏輯是“主動代理執行”。使用者只需要表達意圖:“幫我查 2025 年 AI 行業投融資報告。”Atlas 會自動抓取資料、比對來源、生成總結。網頁不再是目的地,而是原料。人類不再是搜尋者,而是被服務者。這意味著,搜尋本身開始過時。Google 的商業模式——搜尋、跳轉、曝光、變現——在這一刻被壓縮成兩步:問題 → 答案。當結果直接生成,流量就不再需要中轉。廣告、SEO、內容分發體系都會被抽空。Atlas 不是在與 Chrome 競爭,它在殺死“搜尋”這一概念。AI 的野心:從 工具 到 基礎設施表面上,Atlas 是一款新瀏覽器,實際上,它是 OpenAI 戰略閉環的關鍵一環。ChatGPT 是語言介面,Sora 是視覺介面,Whisper 是語音介面,Atlas 則是行為介面。四層合一,構成完整的 AI 作業系統:人類提供目標,AI 負責執行。這是一場“操作權”的遷移。第一次遷移,是從命令列到圖形介面;第二次,是從人類操作到 AI 操作。表面是效率革命,底層是決策權讓渡。行業的震盪:網頁被掏空,內容被壓縮AI 瀏覽器的衝擊將重塑整個網際網路生態。首先是 流量的蒸發。AI 總結網頁內容後,使用者不再訪問原站點。SEO 最佳化失效,廣告點選率驟降。其次是 原創的隱形死亡。AI 在讀取網頁時重組資訊,原始作者與來源被模糊化,智慧財產權邊界變得模糊。再次是 注意力的重組。未來的流量入口,不再是“搜尋引擎”或“社交平台”,而是模型本身。誰擁有模型分發權,誰就重新定義了網際網路的中心。網頁不再承載內容,它只是被 AI “吸收”的資料池。使用者的幻覺:便利的盡頭是控制Atlas 的體驗幾乎完美。它記得你、理解你、預測你。它節省時間,也塑造你。AI 學習的不僅是搜尋記錄,還有你的思維節奏、判斷方式、偏好結構。你越用,它越懂,你越依賴。久而久之,判斷變成預設,選擇變成默認。你以為自己在使用 AI,其實 AI 正在使用你。效率帶來的是順從,順從帶來的是控制。中國的平行進化:多入口的另一種 Atlas在中國,ChatGPT Atlas 尚未落地,但“AI 瀏覽器”這條賽道,已被本土廠商迅速跟進。百度、夸克、騰訊、360 等,都在建構自己的 AI 瀏覽器。但中國網際網路沒有單一入口,微信、小紅書、抖音、知乎……每一個都是獨立宇宙。這意味著,中國的 AI 瀏覽器不會複製 Atlas,而會長成 場景分佈式的智能層。它將嵌入超級 App 內部,成為“第二作業系統”:辦公場景裡的 AI 助手、內容平台裡的摘要與問答、以及企業側的自動化代理。中國的挑戰不是技術,而是規則。資料安全、隱私合規、平台開放度——這些都將決定 AI 瀏覽器的最終形態。被溫柔接管的時代從 Netscape 到 Chrome,瀏覽器讓人類第一次連接世界。而 Atlas ,讓 AI 第一次理解世界。它不是功能升級,而是權力遷移。過去我們用瀏覽器探索網際網路,現在 AI 用瀏覽器重組網際網路。人類不再是“操作者”,而是“意圖的提供者”。這場革命沒有喧囂,沒有宣言。它以“效率”之名,完成了人類對 AI 的最後一場讓渡。 (科技漩渦)